arXiv时代，应如何看待那些互相矛盾的论文？

Original Haixin、LiamKofi 数据实战派 2022-01-14

收录于话题 #计算机科学 55个

原文：How to Make Sense of Contradictory Science Papers

作者：Haixin Dang（利兹大学博士后研究员）、Liam Kofi Bright（伦敦经济学院的哲学系助理教授）

译者：武文浩

相信你已经读到过一些相互矛盾的研究结论。

比如，有的研究说 “喝红葡萄酒可能有益于心脏健康”，有的研究则认为 “喝红葡萄酒对心脏健康有害”，又比如在过去的一年里，有的论文说 “口罩对遏制新冠病毒的传播至关重要”，有的论文则认为 “口罩对新冠病毒的传播或影响不大”（译者注：还有计算机科学领域所司空见惯的，AI 算法用来预测某项疾病的准确率达到 90% 以上，但又有调查显示这些算法根本不准确）。

通常，人们会期望科学家在撰写并审核论文时谨慎行事，因此也会比较重视和信任已发表的研究，默认它们应该是充分论证过了的，且作者团队也相信论文所得出的结论。但现实是，科研论文的出版标准或许并没有人们所预想的那么高，有的时候，出版的科研论文 “既不需准确，也不需合理，甚至作者也不一定要‘相信’自己所得出的结论”。

当然，这不是在说 “科学家们会在论文结论中撒谎”，而是认为科学论文 “并不仅是报告研究的发现”，也可以看作是在履行重要的社会职能，因为对于研究者和论文来说，能引起人们对一个 “值得进一步调查” 的方向的注意也是可为的。

一个想法，或者说一个假设，并不需要一定是对的，只要这个想法或者假设能经得起论证，比如与所能得到的数据相符，那么，这样的想法或假设就能以科研论文的形式被发表出来，跟几个特定的科学家是否相信研究结论没有关系。

事实上，审核科研论文的同行评议过程本身，也不是为了审查论文是否有捏造数据或其它形式的学术不端存在的，而是为了将那些更 “值得被注意” 的内容筛选出来。因为很多时候，那些出乎意料和发人深省的发现，并不总是能跟我们 “判断一件事物是否真实” 的标准同道而行，而是在科研领域内接近极致的数据收集和处理下才得以显现。

此外，能在相对广阔的范围内，互相交流彼此认为有趣的想法，对科学家们能有效地对一些问题进行集体探究来说也是十分必要的。

比如，天体物理学家 Avi Loeb 就曾提出，我们已知的太阳系的第一个 “天外来客”—— Oumuamua 可能并非自然彗星，也有可能是一艘外星光帆太空船。当然，Avi Loeb 应该明白，他需要更多的数据和进一步的研究才能使得该假设成立，甚至他本人可能都对这个他自己提出的假设持 “不可知论” 的观点。

但 Avi Loeb 还是选择公布了他当时所掌握的有限数据，以及他基于这些数据所做的假设。

尽管他的许多同僚都对他的论述提出了理由充分的异议，但对 Avi Loeb 本人来说，能将他的想法公之于众，并引起学界对此的关注和讨论，甚至公众对天文学和物理学的关注和讨论，就足够了，即有的时候发表学术论文并不是为了传播真理，而是在试图通往真理的过程中也让更多的人注意到一些 “令人兴奋且有趣的”、值得人们进一步调查和研究的事物。

但是，为什么我们需要关注科学家们分享他们工作成果的方式呢？

大多数读者可能会从 “制造和传播虚假信息的危害” 角度来思考这一问题，但这并非我们需要关注该问题的唯一理由。因为，现在的情况是，科研工作者们书写科研论文或报告的方式，与大多数人的阅读习惯间存在着严重的脱节，而鉴于科学家们通常需要基于他们所掌握的信息参与一些重要决策，由这种脱节所造成的科研信息与大众认知间的鸿沟，便很有可能会酿成灾难性后果。

比如，在 20 世纪后半叶时，语言学研究对 “人类儿童是如何进行阅读和写作的” 提出了许多理论，而在缺乏实验和证据的情况下，由于当时的美国民众对于 “全语言法（the whole language approach）” 的接受度很高，美国政府大胆地对教育系统进行了一些列改革，在教儿童阅读时不再强调 “拼音” 的概念，而是强调单词在句中的意义。结果后续的研究却得出了政府方略相反的结论，发现重视发音的教学方法对儿童学习语言来说更为有效。

我们这里要探讨的，并不是 “沟通鸿沟” 在某一个或几个特定事件中所构成的影响，而是过去所有由这种鸿沟所造成的负面影响加在一起，对公众是否还会在未来选择相信科学的影响。

因为每当这种鸿沟对生活造成负面影响时，我们对科学的信任都会被腐蚀掉一点，而如果坐以待毙，我们对科学的信任最终便会被腐蚀殆尽。规避这一问题，需更清楚地认识 “发表科研论文” 的意义所在。

哲学家卡尔 - 波普尔（Karl Popper）曾提出，科学（发展）需要大胆的猜想和尝试性的反驳，而这也正是现在我们所知的 “证伪主义” 的核心观点。

对反驳持开放态度，曾是科学研究中最被人们广为赞赏的原则之一，但现在人们往往大多强调反驳的重要性，而忽略了大胆猜想的必要性。

而本文认为，除了大胆猜想，科学家们互相沟通用的论文出版系统也需要做出改变，出版系统需要能高效地筛选出哪些猜想最值得关注，但又不能过于保守，以至于那些大胆的猜想会遭受到系统性地打压。

我们在日常生活中，通常并不会有以上的这种担忧，比如，我问你 “把钥匙放哪了”，并不是想知道你关于锁匠的大胆论述，而只是想知道钥匙放哪了。这个例子中，沟通的双方都要满足一个 “很高” 的标准，沟通才能被完成，这一点也在哲学研究里有被充分讨论过。

有的哲学家认为，标准在于，你必须知道你的论述是否真实。也有哲学家认为，这一标准是，即使你不知道你的论述是否真实，你的论述的真伪性也要能在论述的过程中得到证明。还有的哲学家认为，这一标准应该是，即使你既不知道也没有理由证明你的论述，你至少也要相信你是知道 “论述的真伪”，或者，相信你的论述是有逻辑的且能被证明 “是真的”。

幸运的是，我们刚才所探讨这些哲学标准，并没被广泛地应用在科研沟通中。

我们容忍了这样一个事实，即科研在其本质上可视作一种猜测性工作，科研工作者必须不断地对自然界中的惊喜持开放态度，并在概念上展开及探索任何的新发现。但问题在于，公众对科学的常识性尊重，很可能会使他们做出一些无益的假设，比如有一项研究的结论与我们平常的生活习惯有出入，则会惯性思考地认为，那篇论文的结论比生活经验要可靠，那篇论文应该是被充分论证过了的且足够可信。

很明显，上述的那种惯性思考所得结论并不可靠。可以想象，当一名普通大众仔细拜读一篇结论令人 “眼前一亮” 的论文，并发现数据支撑并不足以令人信服时，该会有多么的失望。

想让科学家们在工作中，达到哲学家们所探讨的那些沟通中的 “高标准” 并未易事，而科研本身其实也需要人们对已发表的主张采取 “宽容和开放” 的态度，以使科研工作者们能更好地完成他们的重要工作。

此外，在传统的学术出版之外互相交流成果的现象已经越来越常见，我们又应如何看待发布在 medRxiv 和 bioRxiv 等在线档案库上的预印版（preprints）论文日益增长的影响力呢？

当前的科技记者们在报道中越来越依赖于未经同行评议的论文，这逐渐改变了科学传播的规范。比如说过去的一段时间里，公众以前所未有的速度直接参与到与 COVID-19 有关的研究中，而科研工作者们也因此能更快捷地了解同僚的研究，并跳过期刊发表和同行评审相互交流。

但这种开放性，或者说便捷性，也有可能会导致人们误解论文所要传达的内容。

预印版论文与最终发表的严谨论文间存在着一定差距，它们为我们所呈现的，是那些相对而言更为混乱和大胆的猜想，而为了避免之前所提到的 “沟通鸿沟” 造成不好的结果，我们就必须要清楚认识到，经过严谨审核的研究，与预印本间的区别，也要认识到，发表论文并非是要阐述一个 “真理”，而是要与人们共享一个想法、一个猜想，进而引发更多对此的思考和研究。

比如，之前提到的 Avi Loeb，他其实可能并不相信太阳系的第一个 “天外来客” 会是外星飞船，但他所提出的那种可能仍是严谨的科学，而非某种胡思乱想。

Reference：

1、https://nautil.us/issue/100/outsiders/how-to-make-sense-of-contradictory-science-papers

往期推荐

丨麻省理工学院学者万字长文：计算机作为一种通用技术的衰落

丨你的脸是这样丢掉的：人脸数据集的史上最大规模调查

丨 MIT 机器人教父 Rodney Brooks：机械臂编程语言的起源

丨一家图灵奖得主背书创企的陨落，暴露了 AI 弱国 “恒弱” 的困境？

丨从本体论到知识图谱，著名学者 Pascal Hitzler 长文回顾语义网 20 年发展

关于数据实战派

数据实战派希望用真实数据和行业实战案例，帮助读者提升业务能力，共建有趣的大数据社区。

警察殴打打人学生，舆论撕裂的背后

商场里，卖不掉的“衣服”都去哪了？导购员不会说，内行人却都懂.

骗P天花板？

大摩宏观策略谈：2025中美变局展望

沉浸式消耗补货！这15件妈见夸的平价宝贝，好用到我倒立爬行！

arXiv时代，应如何看待那些互相矛盾的论文？

丨这篇论文，透露谷歌团队所构想的 “未来搜索”

丨 449 页 pdf，FaceBook 称其迈出 “重塑 AI 科学的第一步”

丨我们可能已见证第一场人工智能战争

丨斯坦福 AI Lab 好文：知识图谱深度介绍

丨 70 多年前，这位精通 IBM 中文打字机的神秘女子是谁？

丨清华团队最新成果：可致特朗普能咏比特币，AI 写古诗 “更上一层楼”

丨麻省理工团队新突破，弥补深度学习在交通领域上的关键欠缺

丨分析 30 年大脑研究发现，人脑并没有男女之分

丨机器学习迈向量子化：范式转变惊鸿一瞥

丨香奈儿们的 AI 实验室都在做什么？

丨比 GPU 快 15 倍，CPU 算法训练深度神经网络 “超车” 成功

丨 “从业 3 年后，我永远离开 AI 行业的 5 个原因”

丨 Bengio 团队因果学习论文反思：为何机器学习仍在因果关系中挣扎？

丨出乎意料，对抗训练可对机器人产生重大负面影响

丨  贝叶斯网络之父 Judea Pearl 推荐：迈向可解释的知识驱动系统

您可能也对以下帖子感兴趣

警察殴打打人学生，舆论撕裂的背后

商场里，卖不掉的“衣服”都去哪了？导购员不会说，内行人却都懂.

骗P天花板？

大摩宏观策略谈：2025中美变局展望

沉浸式消耗补货！这15件妈见夸的平价宝贝，好用到我倒立爬行！

生成图片，分享到微信朋友圈

arXiv时代，应如何看待那些互相矛盾的论文？

您可能也对以下帖子感兴趣